A gépi szövegfelolvasás igen hatékony megoldást jelent a felhasználóval való kommunikációra és egyre inkább előtérbe kerülnek a modern informatikai rendszerekben (pl. mobiltelefonok, tabletek, autós navigációs rendszerek, stb.). A rendelkezésre álló megoldások jelenleg jól érthetőek, azonban nem természetes hangzásúak és igen magas a számításigényük. Célunk, hogy az újabb szintetizátorok jobban megközelítsék az emberi beszédet . A mélytanulás (Deep learning, DNN) alapú szövegfelolvasó nagy (több GB-os) adatbázis tárolása helyett a beszédre jellemző paramétereket tanulja meg gépi tanulási módszerekkel és fizikai modell alapján állítja elő a beszédet. Fő előnye a többi szövegfelolvasóval szemben, hogy jó minőségű, módosítható beszédhangot állít elő. A hallgató segítségünkkel a laboratóriumi munka első felében megismeri a jelenleg használt különböző típusú rendszereket, a DNN alapú beszédszintézis alapjait és a rendelkezésre álló magyar nyelvű DNN szövegfelolvasót, majd az első időszak után bekapcsolódik a laborunkban folyó DNN szintetizátor kutatásába és fejlesztésébe. A hallgatóval közösen állapítjuk meg, hogy a kutatás és fejlesztés melyik területével szeretne foglalkozni (pl. a beszédszintetizátor Google Android mobiltelefonon való optimalizálása, a beszédszintetizátor minőségének javítása, beszélő hangkarakterének utánzása, stb.). A feladatok megoldása programozási részeket is tartalmaznak, de nem szükséges komoly programozási tapasztalat, a félévek során ezek megszerzésére is lehetőség nyílik. Tudományos érdeklődés esetén lehetőség van kutatási munkára is, a téma elméleti kihívásokat is tartalmaz, amely TDK konferencián való részvételhez is megfelel. A téma diplomáig, illetve akár PhD témaként is folytatható. Elvárás: Korrekt, egyenletes munkavégzés, olvasás szintű angol tudás. Villamosmérnök és informatikus hallgatókat egyaránt várunk.